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Un modèle booléen pour l'énumération des siphons 
et des pièges minimaux dans les réseaux de Pétri 
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Résumé 

Les réseaux de Pétri sont un formalisme simple pour 
modéliser les calculs concurrents. Récemment, ils se sont 
révélés être un outil puissant de modélisation et d'ana- 
lyse des réseaux de réactions biochimiques, en comblant 
le fossé entre les modèles purement qualitatifs et quan- 
titatifs. Les réseaux biologiques peuvent être larges et 
complexes, ce qui rend leur analyse difficile. Dans cet 
article, nous nous concentrons sur deux propriétés struc- 
turelles des réseaux de Pétri : les siphons et les pièges, 
qui nous apportent des informations sur la persistance 
de certaines espèces biochimiques. Nous présentons deux 
méthodes pour énumérer les siphons et les pièges mini- 
maux d'un réseau de Pétri en itérant la résolution d'un 
problème booléen, interprété comme un programme SAT 
ou PLC(B). Nous comparons les performances de ces 
méthodes avec un algorithme dédié qui représente l'état 
de l'art dans la communauté des réseaux de Pétri. Nous 
montrons que les programmes SAT et PLC(B) sont plus 
efPicaces. Nous analysons pourquoi ces programmes sont 
si performants sur les modèles de l'entrepôt de modèles 
biomodels.net et nous proposons des instances difficiles 
pour le problème de l'énumération des siphons mini- 
maux. 

Abstract 

Petri-nets are a simple formalism for modeling 
concurrent computation. Recently, they hâve emerged as 
a powerfui tool for the modeling and analysis of bioche- 
mical reaction networks, bridging the gap between purely 
qualitative and quantitative models. Thèse networks can 
be large and complex, which makes their study difficult 
and computationally challenging. In this paper, we focus 
on two structural properties of Petri-nets, siphons and 
traps, that bring us information about the persistence 
of some molecular species. We présent two methods for 
enumerating ail minimal siphons and traps of a Petri-net 



by iterating the resolution of a boolean model interpreted 
as either a SAT or a CLP(B) program. We compare the 
performance of thèse methods with a state-of-the-art de- 
dicated algorithm of the Petri-net community. We show 
that the SAT and CLP(B) programs are both faster. We 
analyze why thèse programs perform so well on the mo- 
dels of the repository of biological models biomodels.net, 
and propose some hard instances for the problem of mi- 
nimal siphons enumeration. 



1 Introduction 

Les réseaux de Pctri ont été introduits dans les an- 
nées 60 comme un formalisme simple pour décrire et 
analyser les systèmes concurrents, asynchrones, non 
déterministes et éventuellement distribués. 

L'utilisation des réseaux de Pétri pour représen- 
ter les modèles de réactions biochimiques, en forma- 
lisant les espèces moléculaires par les places et les ré- 
actions par les transitions, a été introduite assez tar- 
divement dans [in] , en proposant certains concepts 
et outils des réseaux de Pétri pour l'analyse de ces 
réseaux biochimiques. Dans |20j . un programme lo- 
gique avec contraintes sur domaines finis (PLC(DF)) 
est proposé pour le calcul des P-invariants. Ces inva- 
riants fournissent des lois de conservation structurelles 
qui peuvent être utilisées pour réduire la dimension des 
équations différentielles ordinaires (EDO) associées à 
un modèle de réactions avec expressions cinétiques. 

Dans ce papier, nous considérons les concepts de si- 
phons et pièges des réseaux de Pétri. Ces structures 
sont liées au comportement dynamique du réseau : 
la vérification de l'accessibilité (est-ce que le système 
peut atteindre un état donné) et à la vivacité (ab- 



sence de blocages). Ces propriétés ont été déjà utilisées 
pour l'analyse des réseaux métaboliques [H]. Un pro- 
gramme linéaire en nombres entiers est proposé dans 
[3] et un algorithme dédié est décrit dans [5] pour les 
calculer. 

Un siphon est un ensemble de places qui, une fois 
non marqué, le reste. Un piège est un ensemble de 
places qui, une fois marqué, ne peut jamais perdre 
tous ses jetons. Un exemple typique de siphon est un 
ensemble de métabolites qui sont progressivement ré- 
duits au cours d'une famine ; un exemple typique de 
piège est l'accumulation de métabolites qui sont pro- 
duits au cours de la croissance d'un organisme. 

Dans cet article, après quelques préliminaires sur 
les réseaux de Pétri, les siphons et les pièges, nous 
donnons un modèle booléen simple de ces propriétés. 
Nous décrivons deux méthodes pour énumérer l'en- 
semble des siphons et des pièges minimaux et nous 
les comparons avec un algorithme dédié qui représente 
l'état de l'art [5], sur un banc d'essai composé à la 
fois du dépôt P etriweb| [5] et de l'entrepôt de modèles 
biomodels.net [13]. Dans la dernière section, nous ex- 
pliquons pourquoi les programmes proposés sont très 
performants sur les modèles biochimiques de l'entrepôt 
Biomodels.net et proposons certaines instances diffi- 
ciles pour le problème de l'énumération des siphons 
minimaux. 



2 Préliminaires 



Cette notation reste valable pour une séquence de 
transitions a = (to...tn) en écrivant m — > rn' si 

to' pour les marquages 



tr^-l 



t,, 



m — > Toi -=^ 

TOl,...,TO„. 

La représentation classique d'un modèle de réactions 
par un réseau de Pétri consiste à associer aux espèces 
chimiques des places et aux réactions des transitions. 

Exemple 1. Le modèle réactionnel de la 
réaction enzymatique de Michaelis-Menten 
A + E <=> AE => B + E correspond au réseau de 
Pétri de la Figure^ 




Figure 1 - Modèle biochimique de l'Exemple [ÎJ re- 
présenté comme un réseau de Pétri avec un marquage 
validant ii. 



2.1 Réseaux de Pétri 

Un réseau de Pétri PN est un graphe biparti orienté 
PN = (P, T, W) , où P est un ensemble fini de som- 
mets appelés places, T est un ensemble fini de sommets 
(disjoint de P) appelés transitions et W : {{P x T) U 
(T X P)) — ^ N représente un ensemble d'arcs orientés 
et pondérés par des entiers (le poids zéro représente 
l'absence d'arc). Un marquage d'un graphe de réseau 
de Pétri est une fonction to. : P — ?► N, qui affecte un 
certain nombre de jetons à chaque place. Un réseau de 
Pétri marqué est un 4-tuple (P, T, W, toq) où (P, T, W) 
est un réseau de Pétri et m^ est un marquage initial. 

L'ensemble des prédécesseurs (resp. successeurs) 
d'une transition t e T est l'ensemble des places 
•t = {p e P I W{p,t) > 0} (resp. t' = {p e P \ 
W{t,p) > 0}). De même, l'ensemble des prédéces- 
seurs (resp. successeurs) d'une place p £ P est l'en- 
semble de transitions 'p ^ {t e T \ W{t,p) > 0} 
(resp. p* = {i e T I Wip,t) > 0}). 

Pour tous marquages tti, ttt,' : P — > N et toute tran- 
sition t G P, il y a une étape de transition m ^ m' , 
si et seulement si pour tout p £ P, m{p) > W{p, t) et 
m'{p) = m{p) -W{p,t) + W{t,p). 



2.2 Siphons et Pièges 

Soit PN = (P, T, W) un réseau de Pétri. 

Définition 1. Un piège est un ensemble non vide de 
places P' Q P tels que ses successeurs sont aussi des 
prédécesseurs : P" Ç 'P'. 

Un siphon est un ensemble non vide de places P' Ç 
P tel que ses prédécesseurs sont aussi des successeurs. 
•P' Ç P'V 

Remarquons qu'un siphon dans PN est un piège 
dans le réseau de Pétri dual obtenu en inversant la 
direction de tous les arcs de PN. Notons aussi que 
puisque les successeurs (resp. prédécesseurs) d'une 
union sont l'union des successeurs (resp. prédéces- 
seurs), l'union de deux siphons (resp. pièges) est un 
siphon (resp. piège). 

Les propositions suivantes montrent que les pièges 
et les siphons donnent une caractérisation structurelle 
de certaines propriétés dynamiques des marquages. 

Proposition 1. fWj Pour tout sous-ensemble de 
places P' Ç P, P' est un piège si et seulement si pour 
tout marquage m E N^ tel que rrip > f pour certaines 




Figure 2 - Réseau de Pétri de [21] modélisant la crois- 
sance de la plante de la pomme de terre. 

places p G P' , et pour tout marquage m' G N^ tel que 
m ^ m' pour une séquence de transitions a , il existe 
une place p' e P' telle que m' , > 1. 

Proposition 2. 'J8] Pour tout sous-ensemble de 
places P' Ç P, P' est un siphon si et seulement si pour 
tout marquage m G N^ avec rUp = pour tout p G P' , 
et tout marquage m' £ N^ tel que m ^ m' pour une 
séquence de transitions a, nous avons m' , = pour 
toutp' e P'. 

Un exemple d'utilisation des siphons et des pièges a 
été introduit dans [21] : la plante de la pomme de terre 
produit l'amidon et l'accumule pendant la croissance 
pour ensuite le consommer après la récolte. Le réseau 
de Pétri correspondant est représenté par la Figure [2] 
011 Sx représente le glucose- 1-phosphate, 5*2 est UDP- 
glucose et S-i est l'amidon [2T]. Dans ce modèle, l'une 
des deux branches, soit la branche produisant l'amidon 
(is et ^4), soit la branche le consommant (is et tç), est 
opérationnelle. Pi et P2 représentent des métabolites 
externes. 

Il est facile d'observer que l'ensemble {S'2,'S'3} est 
un piège lorsque ta et t^ sont opérationnelles et que 
{5*3, 5'4} est un siphon lorsque is et ig sont opération- 
nelles : une fois un jeton arrive dans 5*3, aucune tran- 
sition ne peut être franchie et le jeton y reste indépen- 
damment de l'évolution du système. D'autre part, une 
fois le dernier jeton est consommé de ^3 et S^, aucune 
transition ne pourra générer un nouveau jeton dans 
ces places qui demeureront vides. 

Dans beaucoup de cellules contenant de l'amidon, 
ce dernier et certains de ces prédécesseurs forment 
des pièges, alors que l'amidon et certains successeurs 
forment des siphons. En effet, soit la branche produi- 
sant l'amidon, soit la branche qui le consomme, est 
opérationnelle et ceci est réalisé par une inactivation 
complète des enzymes appropriées. 



2.3 Minimalité 

Un siphon (resp. un piège) est minimal s'il ne 
contient pas d'autre siphon (resp. piège). Malgré la 
stabilité des siphons et des pièges par union, notons 
que les siphons minimaux ne forment pas un ensemble 
générique de tous les siphons. 




Figure 3 - Réseau de Pétri de l'exemple [2] 



Exemple 2. Dans le réseau de Pétri de la Figure^^ 
{A,B} est un siphon minimal : *{A, P} = {ri,r2} C 
{^, P}* = {ri,r2,r3}. {C, P} est un piège minimal : 
{C,DY = {r4,r5} C '{C,D} = {r3,r4,r5}. 

Un siphon est générique s'il ne peut pas être re- 
présenté sous la forme d'une union d'autres siphons 
[16] . Un siphon minimal est un siphon générique, mais 
un siphon générique n'est pas forcément minimal. Pre- 
nons le cas de l'exemple [2J les siphons sont {A,B} et 
{A, P, C, P} : mais seul le premier est minimal, le se- 
cond ne pourra pas être écrit comme une union de 
siphons minimaux. 

Une motivation pour étudier les siphons minimaux 
est qu'ils procurent une condition suffisante pour la 
non-existence de blocages. En effet, on a prouvé que 
dans un réseau de Pétri bloqué (i.e. oii aucune tran- 
sition ne peut être franchie), toutes les places non- 
marquées forment un siphon [2]. Ainsi, l'approche ba- 
sée sur les siphons pour la détection des blocages vé- 
rifie si le réseau contient un siphon propre (un siphon 
est propre si l'ensemble de ses prédécesseurs est stric- 
tement inclus dans l'ensemble de ses successeurs) peut 
devenir non marqué par une séquence de franchisse- 
ment. Un siphon propre ne devient pas non marqué 
s'il contient un piège initialement marqué. Si un tel 
siphon est identifié, le marquage initial est modifié par 
la séquence de franchissement et la vérification conti- 
nue pour les siphons restants jusqu'à ce qu'un blocage 
soit identifié ou jusqu'à ce que la vérification est ter- 
minée. Considérer uniquement l'ensemble des siphons 
minimaux est suffisant puisque si un siphon devient 
non marqué durant l'analyse alors au moins un siphon 
minimal doit aussi être non marqué. 

D'autres liens avec les propriétés comportementales 
de vivacité sont établis dans [3] . 




Figure 4 - Réseau de Pétri du modèle de l'exemplejSJ 



2.4 Complexité 

Décider si un réseau de Pétri contient un siphon ou 
un piège et en donner un s'il existe est polynomial fî]. 
Cependant, le problème de décision de l'existence d'un 
siphon minimal contenant une place donnée est NP- 
difficile [22] . De plus, il peut y avoir un nombre expo- 
nentiel de siphons et de pièges dans un réseau de Pétri 
comme le montre l'exemple suivant. 

Exemple 3. Dans le réseau de Pétri défi- 
nie par les équations Al + Bl —> A2 + B2, 
A2 + B2 => A3 + B3, .. ., An + Bn => Al + Bl. 
et représenté par la Figure [^ il y a 2" siphons 
minimaux et 2" pièges minimaux, chacun contenant 
soit Ai soit Bi mais pas les deux en même temps, 
pour tout i. 



3 Modèle booléen 

Dans la littérature, plusieurs algorithmes ont été 
proposé pour le calcul des siphons et des pièges mi- 
nimaux d'un réseau de Pétri. Puisque un siphon dans 
un réseau de Pétri TV est un piège dans le réseau dual 
N' , il suffit de traiter les siphons, les pièges sont ob- 
tenus par dualité. Certains algorithmes sont basés sur 
les inégalités [TB] , les équations logiques [101 [H] , ou des 
approches algébriques [H] . Des méthodes plus récentes 
ont été présentées dans [H \5\ . 

Le problème de recherche d'un siphon peut être na- 
turellement décrit par un modèle booléen représentant 
l'appartenance ou non de chaque place au siphon re- 
cherché. L'énumération de tous les siphons peut être 
codée comme une procédure de recherche itérative, si- 
milaire à l'approche branch-and-bound grâce à une 
propriété donnée ci-dessous. 

Pour un réseau de Pétri contenant n places et m 
transitions, un siphon 5* est un ensemble de places tel 
que ses prédécesseurs sont aussi successeurs. 5* peut 
être représenté par un vecteur V de {0, l}" tel que 



pour tout i G {l,2,..,n}, Vi = 1 si et seulement si 
Pi e S. 

La contrainte de siphon peut être formulée comme 
suit : 

Vz, V, = l^iVteT,te'p^^te (Uy^.=ife})*). 

Cette contrainte est équivalente à : 

Vï,y. = l^>;Ç(Uv. = ife})* 

ce qui peut être écrit sous la forme : 

Finalement, afin d'exclure l'ensemble vide, la 
contrainte suivante est ajoutée 

Enumérer uniquement les siphons minimaux (vis- 
à-vis de l'inclusion ensembliste) peut être assuré 
par la stratégie de recherche et l'ajout de nouvelles 
contraintes. 

La stratégie trouve un siphon minimal vis-à-vis 
de l'ordre d'inclusion ensembliste et une nouvelle 
contrainte est ajoutée à chaque fois qu'un tel siphon 
est trouvé afin d'interdire les siphons le contenant dans 
la suite de la recherche. 

Dans une approche précédente [TT] , pour la méthode 
basée sur la programmation avec contraintes, l'ordre 
d'inclusion était assuré par un étiquetage (labeling) 
sur une variable cardinalité dans un ordre croissant. 
Etiqueter directement sur les variables booléennes, par 
valeur croissante (d'abord 0, puis 1), se révèle être 
plus efficace, plus facile à appliquer, et garantit que 
les siphons sont trouvés dans l'ordre d'inclusion en- 
sembliste, grâce à la proposition suivante. 

Proposition 3. Soit un arbre binaire tel que, dans 
chaque nœud instanciant une variable X l'arc gauche 
poste la contrainte X = et l'arc droit poste la 
contrainte X — 1, alors pour toutes les feuilles dis- 
tinctes A et B, la feuille A est à gauche de la feuille 
B seulement si l'ensemble représenté par B n'est pas 
inclus dans l'ensemble représenté par A (c'est-à-dire, 
il existe une variable X telle que Xb > Xa, où Xa et 
Xb dénotent les valeurs instanciées à X dans le trajet 
menant à A et B respectivement) . 

Preuve. A et B ont au moins un noeud ancêtre en 
commun instanciant une variable X. Si la feuille A 
est à gauche de la feuille B, l'arc menant à A est à 
gauche avec la contrainte X = et l'arc menant à B 
est à droite avec la contrainte X = 1, par conséquent 
Xb > Xa. □ 

A chaque fois qu'un siphon (Si) est trouvé, la 
contrainte Vi|Si=i ^i = ^ doit être ajoutée au modèle 
pour garantir que les sur-ensembles de ce siphon ne 
seront pas énumérés. 



4 Algorithmes 

Cette section décrit deux implémentations du mo- 
dèle précédent ainsi que deux stratégies de recherche, 
une utiUsant une procédure SAT itérée et l'autre basée 
sur la programmation avec contraintes. 

4.1 Algorithme SAT itéré 

Le modèle booléen peut être directement interprété 
en utilisant un solveur SAT pour vérifier l'existence 
d'un siphon ou un piège. 

Nous utilisons sat4j , la bibliothèque de satisfiabilité 
et d'optimisation booléenne pour Java qui fournit une 
collection de solveurs SAT efficaces. Elle inclue une 
implémentation des spécifications MiniSAT en Java. 

Pour le réseau de Pétri de la figurejî] représentant 
la réaction enzymatique de l'exemple [T| nous avons le 
codage suivant : chaque ligne est une liste de variables 
séparées par des espaces, elle représente une clause. 
Une valeur positive signifie que la variable correspon- 
dante est sous la forme positive (donc 2 signifie V2), et 
une valeur négative signifie la négation de la variable 
(donc —3 signifie — V3). Dans cet exemple, les variables 
1, 2, 3 and 4 correspondent respectivement à E, A, AE 
et B. Dans la première itération, le problème est de ré- 
soudre les clauses suivantes : 
-2 3 
-3 1 2 
-1 3 
-1 3 
-4 3 

Le problème est satisfiable avec les valeurs : -1, 2, 3, 
-4 ce qui signifie que {A, AE} est un siphon minimal. 
Pour assurer la minimalité, la clause -2 -3 est ajoutée 
et le programme itère une autre fois. Le problème est 
satisfiable avec les valeurs 1, -2, 3, -4, ce qui signifie 
que {E,AE} est aussi un siphon minimal. Une nou- 
velle clause est ajoutée précisant que soit E soit AE 
n'appartient pas au siphon et aucune affectation des 
variable ne peut satisfaire le problème. 

Ainsi, ce modèle contient 2 siphons minimaux : 
{A,AE} et {E,AE). 

L'enzyme E est une protéine qui catalyse (i.e., aug- 
mente la vitesse de) la transformation du substrat E 
en produit B. L'enzyme est conservée dans une réac- 
tion chimique. 

Les résultats obtenus avec cette procédure SAT ité- 
rée sont très bons, comme le détaille la section [5j 

4.2 Algorithme PLC(B) 

La recherche de siphons peut aussi être implémen- 
tée avec un Programme Logique avec Contraintes Boo- 
léennes (PLC(B)). Nous utilisons CNU-Prolog [7] pour 



l'efficacité de ses propagateurs de contraintes boo- 
léennes. 

La stratégie d'énumération est une variation du 
branch-and-bound, où, à chaque fois qu'un nouveau 
siphon est trouvé, la recherche doit trouver un non 
sur-ensemble de ce siphon. 

Nous avons essayé deux variantes de branch-and- 
bound : avec et sans relance. Dans le branch-and- 
bound avec relance, il se révèle essentiel de choisir une 
méthode de sélection des variables diversifiante. En 
effet, les méthodes d'énumération avec un ordre fixe 
de variables accumulent les échecs en essayant tou- 
jours d'énumérer les mêmes ensembles en premier, qui 
sont élagués plus tard par les contraintes de non sur- 
ensembles. L'arbre devient ainsi de plus en plus dense 
à chaque itération puisque plusieurs échecs précédents 
sont explorés à nouveau. Une sélection aléatoire des 
variables assure une bonne diversité, tout comme une 
méthode qui énumère d'abord sur les variables cor- 
respondant aux places figurant dans les siphons déjà 
trouvés. 

Branch-and-bound sans relance donne de meilleurs 
performances à condition de prendre le soin de pos- 
ter chaque contrainte de non sur-ensembles une seule 
fois (les reposer toutes à chaque backtrack est ineffi- 
cace). Cette stratégie est implémentée de la manière 
suivante : à chaque fois qu'un siphon est trouvé, le 
chemin menant à cette solution est mémorisé, puis la 
recherche est entièrement défaite dans le but d'ajou- 
ter au modèle une nouvelle contrainte de non sur- 
ensemble, puis le chemin mémorisé est rejoué pour 
poursuivre la recherche au point où elle a été arrê- 
tée. La figure [5] montre l'arbre de recherche qui est 
développé, il est beaucoup plus satisfaisant que celui 
obtenu avec relance. 

Dans une phase de post-traitement, l'ensemble des 
siphons minimaux peut être filtré afin de ne garder 
que les siphons minimaux qui contiennent un ensemble 
donné de places, pour résoudre le problème NP-difficile 
sus-mentionné. Notons que poster l'inclusion de l'en- 
semble sélectionné de places en premier n'assurerait 
pas que les siphons trouvés sont minimaux vis-à-vis 
de l'inclusion ensembliste. 



5 Évaluation 

5.1 Banc d'essai Petriweb 

Notre premier banc d'essai de réseaux de Pétri est 
le dépôt Petriweb [8 . 

Les instances les plus difficiles sont des études de cas 
dans des processus de raffinement : 

- "Transit" case study - transit 1 process, identifiant 
1454; 




Figure 5 - Arbre de recherche développé avec la stratégie de backtrack sans relance pour le calcul de tous les 
siphons minimaux du réseau 1454 de PetriWeb. 



- "Transit" case study - transitË process, identifiant 
1479; 

- "Transit" case study - transit^ process^ identifiant 
1516; 

5.2 Banc d'essai Biomodels.net 



Nous considérons également l'entrepôt |Biomo-| 
dels.net de modèles de réactions biochimiques [13] 



ainsi que d'autres modèles complexes. Les modèles les 
plus grands sont comme les suivants : 

- la carte de Kohn [Hl [T] représente une carte de 
509 espèces et 775 interactions moléculaires qui 
régissent le cycle cellulaire des mammifères et le 
mécanisme de réparation de l'ADN ; 

- le modèle 175 qui représente les réponses au Li- 
gand du réseau de signalisation de l'ErbB ; 

- le modèle 205 qui représente la simulation de la 
régulation de l'endocytose de l'EGFR et la signa- 
lisation EGFR-ERK ; 

- le modèle 239 qui représente un modèle cinétique 
du réseau de la sécrétion d'insuline stimulée par 
le glucose des cellules bêta du pancréas. 

5.3 Résultats et Comparaisons 

Dans [T7], l'approche PLC a été comparée à un mo- 
dèle linéaire en nombres entiers (PLNE) [3] sur le dé- 
pôt de Biomodels.net elle s'est révélée au moins trois 
fois plus rapide que l'énumération PLNE en utilisant 
un solveur CPLEX. Cet approche PLC implémente le 
modèle booléen décrit dans la section IH Dans cette 



section, nous comparons deux implémentations de ce 
modèle booléen à l'algorithme dédié de l'état de l'art 
que les mêmes auteurs avaient introduit dans [5] . 

L'algorithme dédié utilise récursivement une procé- 
dure de partitionnement pour réduire le problème ori- 
ginal à plusieurs sous-problèmes plus simples. Chaque 
sous-problème possède des contraintes spécifiques sup- 
plémentaires sur les places par rapport au problème 
d'origine. Dans [S] la correction, la convergence et la 
complexité de l'algorithme sont montrées. L'évaluation 
expérimentale de la performance est également traitée. 

Ces algorithmes peuvent être appliqués pour énu- 
mérer les siphons minimaux, les siphons minimaux par 
rapport à une place ou aussi les siphons minimaux par 
rapport à un sous-ensemble donné de places. 

Les tables [î] et [2] fournissent les performances sur les 
modèles de Petriweb et Biomodels.net. Dans la table 
[Tl nous donnons les temps de calcul de tous les siphons 
minimaux des modèles présentés dans les sections [5.1 1 
et |5.2[ Pour chacun de ces exemples, nous fournissons 
le nombre de siphons minimaux, le nombre de places, 
le nombre de transitions et les temps de calcul en uti- 
lisant l'algorithme dédié, l'algorithme SAT et le pro- 
gramme PLC. 

Toutes les durées sont en ms. Les temps de calcul 
sont obtenu en utilisant un PC avec un processeur Intel 
Core 2.20 GHz et 8 Go de mémoire. 

Dans la table [2] nous considérons l'ensemble des 
modèles mis à disposition dans les dépôts de Biomo- 
dels.net et de Petriweb. Pour que ces temps totaux 
aient un sens, nous avons retiré le modèle numéro 175 
de biomodels.net et le réseau numéro 1516 de Petriweb 



car les temps mesurés sur ces deux modèles sont à la 
fois très grands et non représentatifs du cas général : 
on se reportera à la table [î] pour les temps obtenus sur 
ces deux modèles. Pour chaque base de données, nous 
donnons le nombre total de modèles, le nombre mi- 
nimal et le nombre maximal de siphons trouvés et la 
moyenne des nombres des siphons trouvés dans tous 
les modèles. Nous donnons également la taille mini- 
male et la taille maximale des siphons trouvés ainsi 
que la moyenne des tailles sur tous les modèles. Fina- 
lement, nous fournissons le temps de calcul total qui 
n'est autre que la somme des temps de calcul de chaque 
modèle. 

Sur toutes les instances, notamment les plus larges, 
le codage SAT est très efficace. Il convient parfai- 
tement à la taille du réseau ainsi qu'au nombre de 
siphons minimaux. L'algorithme dédié est souvent 
moins efficace avec au moins un ordre de grandeur de 
différence, sauf pour une seule instance, le modèle nu- 
méro 1516 de biomodels.net, pour laquelle l'algorithme 
dédié est environ deux fois plus rapide : cette instance 
est singulière par son grand nombre de siphons mini- 
maux. Le codage CLP a également une meilleur per- 
formance que l'algorithme dédié, mais il semble ma- 
nipuler moins facilement des réseaux de grande taille 
tels que la carte de Kohn, et est très lent sur le modèle 
1516. 



6 Instances difficiles 

MiniSAT dépasse en rapidité l'algorithme spécialisé 
d'au moins un ordre de grandeur et le temps de cal- 
cul est étonnamment court sur nos exemples pratiques. 
Même si le modèle est très grand, par exemple la carte 
de Kohn du contrôle du cycle cellulaire avec 509 es- 
pèces et 775 réactions, le temps de calcul demeure in- 
fime. Pourtant, cette énumération de tous les siphons 
minimaux résout le problème de décision de l'existence 
d'un siphon minimal contenant un ensemble donné de 
places qui a été prouvé NP-difficile dans [13] et la ques- 
tion est : pourquoi le calcul des siphons minimaux est-il 
si facile dans les grands réseaux biochimiques ou dans 
les réseaux de PetriWeb ? 

Une façon d'aborder cette question est de considérer 
la preuve de NP-difficulté par réduction du problème 
3-SAT et le phénomène de transition de phase dans 3- 
SAT. La probabilité qu'un problème 3-SAT aléatoire 
soit satisfiable suit une transition de phase aiguë quand 
la densité a du nombre de clauses sur le nombre de 
variables est au voisinage de 4.26 [EllSj, allant de la 
satisfiabilité vers l'insatisfiabilité avec une probabilité 
de 1 quand le nombre de variables tend vers l'infini. 

La réduction de 3-SAT au problème de l'existence 
d'un siphon minimal traité dans [35] est obtenue avec 



des réseaux de Pétri dont la structure est illustrée dans 
la figure [6] Il est important de noter que dans ce co- 
dage, le réseau de Pétri a un degré entrant maximum 
(pour go) linéaire par rapport au nombre de clauses et 
un degré maximal sortant (pour ip) linéaire par rap- 
port au nombre de variables. 

Sans surprise, cette famille de réseaux de Pétri four- 
nit un banc d'essai difficile pour l'énumération des si- 
phons minimaux. La Table [3] contient les résultats ex- 
périmentaux de ces réseaux de Pétri générésj^ Nous 
considérons un time-out de deux secondes, le symbole 
"-" signifie que le délai de deux secondes n'a pas suffit 
pour énumérer tous les siphons minimaux. Les résul- 
tats de cette section sont obtenus en utilisant un PC 
avec un processeur Intel Core2 Quad 2.8 GHz et 8 Go 
de mémoire. Cette table contient les informations qui 
concernent le codage 3-SAT et le réseau de Pétri cor- 
respondant : pour chaque 3-SAT, nous fournissons le 
nombre de variables booléennes, le nombre de clauses 
et le ratio a, pour le réseau de Pétri correspondant 
nous donnons le nombre de places, le nombre de tran- 
sitions et la densité (ratio du nombre de transitions 
sur le nombre de places). Le temps de calcul de l'énu- 
mération de tous les siphons minimaux en fonction de 
a est représenté dans la figure [7]; il est visible que le 
temps de calcul reste exponentiel autour de la valeur 
critique 4.26 de a. 

De même, des réseaux de Pétri générés aléatoire- 
ment avec des degrés linéaires par rapport au nombre 
de sommets (places et transitions) représentent aussi 
des instances difficiles. Par contre, des réseaux de Pé- 
tri aléatoires ayant des degrés de l'ordre de 10 comme 
c'est le cas des modèles biochimiques sont des ins- 
tances faciles pour le problème d'énumération des si- 
phons minimaux. Ainsi, bien que les modèles de réac- 
tions biochimiques soient de grande taille, en terme de 
nombre de places, leurs degré reste borné à une petite 
valeur ce qui explique pourquoi le problème d'énumé- 
ration des siphons minimaux est si facile en pratique. 

7 Conclusion 

Les siphons et les pièges définissent des groupement 
significatifs de composants qui exposent un compor- 
tement particulier durant l'évolution dynamique d'un 
système biochimique quelles que soient les valeurs des 
paramètres du modèle. 

Nous avons décrit un modèle booléen pour ce pro- 
blème et nous avons comparé deux méthodes pour sa- 
tisfaire ces contraintes de façon à énumérer l'ensemble 
des siphons et des pièges minimaux. 

Le solveur SAT est le plus efficace sur les réseaux de 
grande taille. Le programme PLC(B) est néanmoins 

1. Ce banc d'essai est disponible surlce lienl 



modèle 


# 
siphons 


# 
places 


# 
transitions 


algorithme 
dédié 


sat 


GNU 
Prolog 


carte de Kohn 


81 


509 


775 


28 


1 


221 


BIOMD000000175 


3042 


118 


194 


oo 


137000 


oo 


BIOMD000000205 


32 


194 


313 


21 


1 


34 


BIOMD000000239 


64 


51 


72 


2980 


1 


22 


1454 


60 


39 


48 


15 


1 


11 


1479 


168 


58 


78 


47 


4 


220 


1516 


1133 


68 


102 


2072 


4739 


163 248 



Table 1 - Performance sur les instances les plus difficiles. 



Base de données 


# 
modèles 


^ siphons 
min-max (avg.) 


taille des siphons 
min-max (avg.) 


temps total 


algorithme 
dédié 


SAT 


GNU 
Prolog 


Biomodels.net 


403 


0-64 (4.21) 


1-413 (3.10) 


19734 


611 


231 


Petriweb 


79 


0-168 (6.24) 


1-24 (3.36) 


2757 


457 


240 



Table 2 - Performance sur l'ensemble du banc d'essai. 



siphons computation time (200 variables) 




Figure 7 - le temps de l'énumération de tous les 
siphons minimaux avec un time-out de 2 secondes éta- 
bli une transition de phase au voisinage de la valeur 
de 4.26 du ratio du nombre de clauses par le nombre 
de variables. 



plus efficace d'au moins un ordre de grandeur que l'al- 
gorithme dédié de l'état de l'art [5|. 

Les deux méthodes sont capables de résoudre tous 
les problèmes des dépôts de Petriweb et de Biomo- 
dels.net (daté mars 2012) dans un temps court ce 
qui démontre l'applicabilité de cette approche. Notons 
aussi que le modèle PLC(B) pour calculer les siphons 
et les pièges minimaux est une extension du modèle 
PLC(DF) pour la recherche des P- et T- invariants [20] . 

L'efficacité étonnante de ces méthodes appliquées 
aux modèles biochimiques de biomodels.net a été ex- 
pliquée en montrant que le degré des réseaux de Pétri 
est borné dans les modèles biologiques. 

L'idée d'appliquer les solveurs SAT ou la program- 
mation logique par contraintes aux problèmes clas- 



siques de la communauté des réseaux de Pétri n'est 
pas nouvelle, mais ces approches ont jusque-là été 
davantage appliquées à la vérification de modèles. 
Nous sommes persuadés que les problèmes structu- 
rels peuvent également bénéficier du savoir-faire dé- 
veloppé dans la communauté de la modélisation boo- 
léenne. Cela semble être particulièrement intéressant 
pour la communauté de la biologie des systèmes, où 
les progrès technologiques récents nécessitent de plus 
en plus d'outils d'analyse puissants et d'expertise pour 
des problèmes d'optimisation. 
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Pétri net view 


3-SAT view 
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2,99 
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2000 


10 


137 



Table 3 - Performance sur le banc d'essai généré. 
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